Atelier mathématique pour la journée immersive à l’ENSAI

Ecologie statistique

Marie-Pierre Etienne

ENSAI - CREST

February 13, 2025

Marier statistique et écologie

De quoi est-il question ?

Présentation par Olivier Gimenez ou par Lise Violat

  • Ecologie ?

Science ayant pour objet les relations des êtres vivants (animaux, végétaux, micro-organismes) avec leur environnement, ainsi qu’avec les autres êtres vivants.

  • Statistique ?

Ensemble des méthodes qui ont pour objet la collecte, le traitement et l’interprétation de ces données.

  • Ecologie Statistique Bayésienne ?

    Peut-être

Comment décider si une espèce est en danger

La CITES

La Convention sur le commerce international des espèces de faune et de flore sauvages menacées d’extinction (CITES) : accord international entre Etats qui veille à ce que le commerce international des spécimens d’animaux et de plantes sauvages ne menace pas la survie des espèces

3 annexes au rapport de la CITES

  • Annexe I : espèces menacées d’extinction, commerce pas autorisé sauf cas exceptionnel

  • Annexe II espèces dont le commerce des spécimens doit être réglementé pour éviter une exploitation incompatible avec leur survie.

  • L’Annexe III : espèces protégées dans un pays qui a demandé aux autres Parties à la CITES leur assistance pour en contrôler le commerce.

Evaluer l’effectif d’une population

  • Combien de chats en France ?

  • Combien de chênes en France ?

  • Combien de soles dans l’Océan Atlantique ?

Managing fisheries is hard: it’s like managing a forest, in which the trees are invisible and keep moving around (Pr John Shephard)

Capture Marquage Recature : une méthode pour compter les individus.

FurSeals CMR

Capture Marquage Recature : un exemple plus simple

Ce qui se trouve sous la surface du lac

Capture Marquage Recature : un exemple plus simple

Ce qu’on voit de la surface

Capture Marquage Recature : un exemple plus simple

Supposons qu’on sache qu’il y a 17 étoiles de mer rouge

Capture Marquage Recature : un exemple plus simple

Un engin de pêche capture les étoiles d’une zone

Capture Marquage Recature : un exemple plus simple

Un engin de pêche capture les étoiles d’une zone

Résultat de la pêche : 4 étoiles rouges et 14 bleues

Capture Marquage Recature : un exemple plus simple

Qu’est ce que ça nous apprend

  • sur l’efficacité \(p\) de la méthode de capture : il y a 17 étoiles rouges au total et 4 ont été capturées

Quelle est la valeur de p estimée, c’est à dire quelle est l’estimation de la probabilité pour une étoile de mer d’être capturée ?

On la note \(\hat{p}\).

  • sur le nombre d’étoiles de mers au total ?

il y a N étoiles bleues au total et 14 ont été capturées avec un piège d’une efficacité \(p\).

Comment estimer \(\hat{N}\) ?

Si on refaisait l’expérience (on a remis tout le monde à l’eau) sans changer le nombre d’étoiles marquéesdans le lac, qu’est-ce qui pourrait changer ?

  • Ce qui change d’une fois sur l’autre est une variable aléatoire

CM : nombre d’étoiles capturées rouges

CNM : nombre d’étoiles capturées bleue

  • ce qui est inconnu mais fixe est un paramètre du problème

[p] l’efficacité du piège

[N] le nombre d’étoiles de mer bleues

Chaque réalisation conduit à une estimation de p et et N différent mais on espère jamais très loin de la réalité.

Capture Marquage Recature : Modélisation

On lance une pièce pour chaque étoile de mer, si ca tombe sur face elle est capturée sinon elle reste dans l’eau.

Si on lance 17 fois la pièce, on note \(CM\) est le nombre de face obtenues

Si on lance N fois la pièce, on note \(CNM\) est le nombre de face obtenues

Protocole mis en place durant l’atelier

Dans chaque bac on veut compter le nombre de smarties, avec une méthode CMR. On voudrait évaluer l’efficacité et la précision de notre méthode

  • On a 6 bacs (les lacs), qui contiennent un nombre inconnu de smarties (étoiles de mer bleues et rouges réunies). On a déjà pêché une fois et marqué des smarties, on a donc des smarties d’une couleur différente, les smarties marqués.

  • Dans chaque bac les smarties marqués sont ceux associés à une couleur pécise qui est donnée ci-dessous.

  • On a deux engins de peche

    • le petit bol en verre

    • l’ecocup en plastique

  • Pour chaque bac et chaque engin de peche vous allez pêcher et noter

    • le nombre de smarties de la couleur qui marque pêchés CM

    • le nombre de smarties de l’autre couleur qui a un nombre inconnu qu’on chercher à estimer CNM

Celui qui pêche a le droit de manger un smarties après sa pêche si il peut le remplacer par un smarties identique.

Lac CouleurMarque NMarques
1 bleu 16
2 jaune 10
3 vert 12
4 orange 12
5 orange 11
6 vert 14

Analyse des résultats obtenus

Chargement des données et vérifications

library(tidyverse)
library(ggpubr)
dta <- read.csv('data_CMR.csv', sep = ",")
dta <- dta |> mutate(Engin = as.factor(Engin), Lac = as.factor(Lac))
summary(dta)
 Experimentateur.trice Lac    Engin     Marques      CapturesMarques
 Mode:logical          1:12   P:34   Min.   :10.00   Min.   :0.000  
 NA's:70               2:12   V:36   1st Qu.:11.00   1st Qu.:1.000  
                       3:12          Median :12.00   Median :2.000  
                       4:10          Mean   :12.51   Mean   :1.871  
                       5:12          3rd Qu.:14.00   3rd Qu.:3.000  
                       6:12          Max.   :16.00   Max.   :5.000  
 CapturesNonMarques
 Min.   : 0.000    
 1st Qu.: 2.000    
 Median : 4.000    
 Mean   : 4.614    
 3rd Qu.: 6.750    
 Max.   :19.000    

Analyse des résultats obtenus

Visualisation

## Visualisation
p1 <- dta |> ggplot() + facet_wrap(~Lac) + geom_boxplot(aes(x= Engin, y=CapturesNonMarques )) + ggtitle("nombre de capturés marqués par engin et par lac")
p2 <- dta |> ggplot() + facet_wrap(~Lac) + geom_boxplot(aes(x= Engin, y=CapturesNonMarques ))+ ggtitle("nombre de capturés marqués par engin et par lac")

ggarrange(p1,p2, ncol = 2)

Analyse des résultats obtenus

Estimation de \(\hat{p}\)

dta <- dta |> 
  mutate(phat = CapturesMarques/Marques, 
         Nhat = CapturesNonMarques/phat + Marques)


dta |> ggplot() + facet_wrap(~Lac) + geom_boxplot(aes(x= Engin, y=phat ))

Analyse des résultats obtenus

Estimation de \(\hat{N}\)

dta |> ggplot() + facet_wrap(~Lac) + geom_boxplot(aes(x= Engin, y=Nhat ))

Il y a des estimations très élevées.

Analyse des résultats obtenus

Comparaison avec la vérité

La véritée est la ligne rouge. Pour la visualisation, nous ne représentons pas les valeurs extrêmes

truth <- data.frame(N = c(70,58,43,26,51,33), Lac = 1:6) |> mutate(Lac = as.factor(Lac))
dta |> 
  inner_join(truth) |> 
  ggplot() + facet_wrap(~Lac) + geom_boxplot(aes(x= Engin, y=Nhat )) + geom_hline(aes(yintercept = N), col = "#C94326") + ylim(c(0, 120))

Illustrations

Created by Kim Sun Yung from Noun Project

Created by aditya_chan from Noun Project

Created by Lars Meiertoberens from Noun Project